\chapter{ Estado del arte}

[REVISAR]

Karssemeijer presenta un m\'etodo autom\'atico en el que se emplean caracter\'isticas extra\'idas del histograma de niveles de gris obtenidas de 615 mamograf\'ias digitales~\cite{karssemeijer98}. Oliver et al. emplean un m\'etodo de clasificaci\'on autom\'atica basado en descriptores de textura~\cite{oliver08}. Saha et al. presentan un m\'etodo basado en conectividad difusa sobre diversos conjuntos de caracter\'isticas~\cite{saha01}. Demuestran que para establecer correctamente la densidad de la mama se requiere de t\'ecnicas m\'as sofisticadas que el simple establecimiento de un umbral de gris.

Los m\'etodos existentes de clasificaci\'on de la densidad mamogr\'afica se basan t\'ipicamente en vectores de caracter\'isticas que describen el brillo, la textura u otras propiedades visuales de la imagen. En los \'ultimos a\~nos existe un inter\'es creciente en el uso de aproximaciones que describen la imagen como distribuciones (histogramas) de caracter\'isticas locales (bag-of-visual-words)~\cite{zhang07, csurka04, farquhar05}. La idea se basa en aplicar los modelos de "bag-of-words" ampliamente utilizados en la clasificaci\'on de documentos, a la clasificaci\'on de im\'agenes. Parte del equipo de trabajo del presente proyecto ha aplicado aproximaciones de este tipo obteniendo muy buenos resultados~\cite{llobet09}.



[REVISAR 2 --> Sacado de tesina jsolves]

Karssemeijer et al.~\cite{karssemeijer98} presentan un m\'etodo autom\'atico que emplea caracter\'isticas extra\'idas del histograma de niveles de gris. Extrayendo regiones de inter\'es de la mama basadas en la distancia que hay de la regi\'on al m\'usculo pectoral, obtiene sus histogramas. Consiste en segmentar la mama en 5 partes diferentes (a un 20\%, 40\%, 70\% y 90\% del borde de la mama, respectivamente), y usar los histogramas de las 3 partes centrales (la del 40\%, el 70\% y el 90\%) como vector de caracter\'isticas.


Para la clasificaci\'on se aplica la t\'ecnica de k-Vecinos sobre el vector de histogramas resultante. Emplean cuatro clases de densidad y obtienen una concordancia del 67\% entre el sistema autom\'atico y el experto humano, utilizando una base de datos privada con 615 mamograf\'ias.

Oliver et al.~\cite{oliver05} aplican un m\'etodo que utiliza descriptores de textura como aproximaci\'on a la extracci\'on de caracter\'isticas y \'Arboles de Decisi\'on para la clasificaci\'on en tres categor\'ias. Consiguen una concordancia del 73\%.

En 2004, Hadjidemetriou et al. describen un m\'etodo que emplea la t\'ecnica conocida como Histograma de Multiresoluci\'on, consistente en emplear caracter\'isticas calculadas a partir de histogramas obtenidos a distintas escalas de resoluci\'on de una misma imagen. De esta forma, se pretende tener en cuenta la informaci\'on espacial de la imagen que con un \'unico histograma no se tiene en cuenta. Muhimmah et al.~\cite{muhimmah06} lo aplican en 2006 a la clasificaci\'on de la densidad de las mamograf\'ias, mediante un clasificador de M\'aquinas de Soporte Vectorial (SVM). Consiste en obtener una pir\'amide de im\'agenes reescaladas a la mitad de tama\~no cada vez, y realizar varias operaciones sucesivas entre ellas para obtener un vector de caracter\'isticas. Las operaciones son, en orden sucesivo: normalizaci\'on de los histogramas, obtener los histogramas acumulativos, realizar la diferencia entre los histogramas acumulativos consecutivos y, por \'ultimo, reducir cada una de las diferencias en un factor de $2^3/4$.


Se obtiene una concordancia entre la m\'aquina y el experto humano del 77,6\% usando la base de datos MIAS (con 3 clases). Aqu\'i se prob\'o que la informaci\'on espacial proporcionada por los histogramas de multiresoluci\'on puede dotar de una capacidad m\'as discriminatoria al an\'alisis de histograma en las mamograf\'ias.
gen 25. Media de los histogramas de las 3 clases para los distintos niveles de reducci\'on.

Bovis et al. eval\'uan cuatro aproximaciones distintas para extraer caracter\'isticas de textura: matrices de niveles de gris utilizando distintas propiedades (momentos angulares, correlaciones, media, varianza, etc.), transformada de Fourier sobre la frecuencia de la mamograf\'ia, convoluci\'on con m\'ascaras de texturas de Law y Transformaci\'on Discreta de Wavelets (DWT). Luego reducen el conjunto de caracter\'isticas resultante mediante PCA. Y en la etapa de clasificaci\'on utilizan una combinaci\'on de clasificadores. Se eval\'uan 377 mamograf\'ias obtenidas de la base de datos DDSM. Los autores consiguen una tasa de aciertos del 71,4\% cuando emplean cuatro niveles de densidad, y del 96,9\% cuando se definen \'unicamente dos niveles de densidad.

Los excelentes resultados con 2 clases no sirvieron para ocultar los problemas que ten\'ia la metodolog\'ia a la hora de discriminar en un problema con m\'as clases.

Saha et al. (2001)~\cite{saha01} presentan un m\'etodo basado en conectividad difusa sobre diversos conjuntos de caracter\'isticas. La conectividad difusa establece enlaces entre categor\'ias de objetos, de manera que un objeto est\'a m\'as fuertemente conectado con una categor\'ia cuando la longitud del enlace es menor.


Demuestran que para establecer correctamente la densidad de la mama se requiere de t\'ecnicas m\'as sofisticadas que el simple establecimiento de un umbral de gris.

En 2008, Oliver et al.~\cite{oliver05, oliver08} presentan un nuevo m\'etodo autom\'atico (perfeccionando uno que ellos mismos hab\'ian presentado) en el que dividen la mama autom\'aticamente en tejido denso y no denso, mediante clustering (con fuzzy C-means). Con estos dos clusters, se obtienen caracter\'isticas morfol\'ogicas y de texturas para estas dos clases: los cuatro primeros momentos del histograma para ambos clusters (como caracter\'isticas morfol\'ogicas) y las matrices de coocurrencia (para las texturas). Los cuatro momentos del histograma utilizan la media, la desviaci\'on t\'ipica, asimetr\'ia y curtosis del histograma, mientras que las matrices de coocurrencia son matrices con las coocurrencias de pares de niveles de gris separados mediante un \'angulo (que en el art\'iculo cuenta con cuatro variaciones de 0o, 45o, 90o y 135o). Se utilizan dos clasificadores distintos, k-vecinos y \'arboles de decisi\'on, para clasificarlas y por \'ultimo se combinan ambos mediante una aproximaci\'on bayesiana de la forma que muestra la Imagen 28.


Los resultados con la base de datos MIAS (3 clases) obtiene un 86\% de aciertos (utilizando las mamograf\'ias etiquetadas por tres expertos diferentes y an\'onimos) y con un subconjunto sin precisar de la DDSM (4 clases) consigue un 77\%.


[REVISAR 3 ---> Articulo I+S 2008]

El an\'alisis de la densidad de la mama asistido por ordenador podr\'ia
ayudar a clasificar las mamograf\'ias de un modo m\'as objetivo y
coherente y, consecuentemente, establecer el factor de riesgo para
desarrollar c\'ancer de mama con mayor precisi\'on. Sin embargo, a pesar
del indudable inter\'es que comporta la estimaci\'on de la densidad de la
mama de un modo objetivo, han sido pocos los esfuerzos realizados en
este sentido dentro del campo del procesado de im\'agenes y an\'alisis por
ordenador.

Unos de los primeros en sugerir el uso del ordenador como herramienta
de ayuda para el an\'alisis de la densidad mamaria fueron Boyd et
al.~\cite{boyd95}. Presentaron un m\'etodo semiautom\'atico para estimar
la densidad de la mama, basado en la selecci\'on manual de dos umbrales
para segmentar la mama y el tejido denso respectivamente. Aunque se
sirve del ordenador para permitir el establecimiento interactivo de
los umbrales, en este caso no se dota a la m\'aquina de ninguna
capacidad de decisi\'on y es el experto humano quien establece el umbral
que discrimina entre tejido graso y denso.

Karssemeijer et al. describen un m\'etodo autom\'atico que emplea
caracter\'isticas extra\'idas del histograma de niveles de gris, obtenidas
de 615 mamograf\'ias digitales~\cite{karssemeijer98}. Para la
clasificaci\'on se aplica la t\'ecnica de \emph{k-Nearest Neighbours}
($k$-NN)~\cite{duda73}. Emplean cuatro categor\'ias de densidad y
obtienen una concordancia del 67\% entre el sistema autom\'atico y el
experto humano.

Oliver et al. aplican un m\'etodo que utiliza descriptores de
textura como aproximaci\'on a la extracci\'on de caracter\'isticas y \'Arboles
de Decisi\'on para la clasificaci\'on~\cite{oliver05}. En este caso
analizan \'unicamente 270 mamograf\'ias obtenidas de la base de datos
MIAS, las cuales clasifican en tres categor\'ias. Consiguen una
concordancia del 73\%.

En~\cite{muhimmah06} se describe un m\'etodo que emplea la t\'ecnica
conocida como \emph{Histograma
Multiresoluci\'on}~\cite{hadjidemetriou04}, consistente en emplear
caracter\'isticas calculadas a partir de histogramas obtenidos a
distintas escalas de resoluci\'on. Se utiliza un clasificador de
\emph{M\'aquinas de Soporte Vectorial} (SVM)~\cite{vapnik95} y se
clasifican las 322 im\'agenes de la base de datos MIAS en tres niveles
de densidad. El sistema obtiene una concordancia entre la m\'aquina y el
experto humano del $77.6\%$.

Bovis et al.~\cite{bovis02} eval\'uan cuatro aproximaciones
distintas para extraer caracter\'isticas de textura: matrices de
coocurrencia, transformada de Fourier, convoluci\'on con m\'ascaras de Law
y Transformaci\'on Discreta de Wavelets (DWT). En la etapa de
clasificaci\'on emplean un paradigma de combinaci\'on de clasificadores
conocido como \emph{Bagging}~\cite{breiman96}. Eval\'uan $377$
mamograf\'ias obtenidas de la base de datos DDSM y realizan una
clasificaci\'on basada en BI-RADS. Consiguen una tasa de aciertos del
$71.4\%$ cuando emplean cuatro niveles de densidad, y del $96.9\%$
cuando se definen \'unicamente dos niveles de densidad.

Saha et al.  presentan un m\'etodo basado en
conectividad difusa sobre diversos conjuntos de
caracter\'isticas~\cite{saha01}. Demuestran que para establecer
correctamente la densidad de la mama se requiere de t\'ecnicas m\'as
sofisticadas que el simple establecimiento de un umbral de gris.

Por \'ultimo cabe resaltar que t\'ecnicas similares a las mencionadas
vienen ofreciendo resultados muy prometedores en el diagn\'ostico
asistido por ordenador de tumores de mama~\cite{cheng06}.
